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摘 要 : [目的 /意义 ] 借 助 数 字 人 文 的 理念 和 方法 ,从 知识 视角 深度 开发 我 国 职 官 领域 相关 资源 ,有 助 于 辅助 领域 学 者 开 
展 深层 次 的 人 文 研究 ,同时 也 能 丰富 数字 人 文 领域 职 官 研究 。[ 方 法 /过 程 ] 在 梳理 清 代 职 官 知 识 体系 结构 和 采集 
相关 数字 资源 的 基础 上 ,构建 清 代 职 官 领域 本 体 模 型 ,并 以 《长春 县 志 ' 长 春 职 官 考释 表 》 为 例 进行 实例 添加 和 可 
视 化 。[ 结果 /结论 ] 实现 职 官 知识 单元 语义 层面 上 的 细 粒 度 描述 和 组 织 ,揭示 知识 单元 间 多 层次 、 多 维度 、 多 种 


类 、 复 杂交 错 的 动态 关系 。 
将 : 数字 人 文 ” 职 官 领域 本 体 ， 知 识 组 织 
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数字 人 文 是 一 个 新 兴 的 、 跨 学 科研 究 领域 , 它 起 源 
文 计算 ,将 文本 挖掘 、 大 数据 .GIS ,语义 网 等 技术 引 
文 研究 中 ,深度 挖掘 数字 资源 中 知识 之 间 隐 含 的 逻 
系 ,提供 知识 层面 的 智能 化 .精准 化 服务 ,并 创造 性 
现 新 知识 。 较 之 传统 的 人 文 研究 ,数字 人 文 呈现 出 
研 沈 对 象 数字 化 上 .研究 主体 多 样 化 .研究 技术 智能 化 
以 路 研究 成 果 智 慧 化 的 特点 ,为 传统 人 文 资源 组 织 与 开 
于 添 了 技术 羽翼, 也 为 这 一 领域 提供 了 新 的 研究 视角 
与 饥 究 范式 。 传 统 的 知识 组 织 以 受 控 词 表 为 核心 ,以 分 
类 法 .主题 法 和 元 数据 法 为 代表 ,对 资源 进行 分 类 标 引 
和 主题 标 引 , 在 资源 描述 与 表示 中 发 挥 着 重要 作用 。 本 
体 是 描述 与 揭示 客观 世界 的 综合 性 .概括 性 ,并 经 过 规 
范 化 的 一 组 概念 , 它 可 以 清晰 地 描述 出 各 种 术语 及 相互 
关系 的 确切 含义 ,实现 知识 的 结构 化 组 织 和 语义 化 关 
联 。 因 此 ,相对 于 传统 的 知识 组 织 研究 ,面向 数字 人 文 
的 知识 组 织 本 质 上 是 新 一 代 的 知识 组 织 , 即 通 过 本 体 、 
关联 数据 .概念 地 图 等 相关 理论 和 技术 方法 ,从 对 资源 
信息 的 描述 转变 为 知识 单元 的 描述 ,组 织 对 象 从 静态 知 
识 和 绝对 知识 转变 为 动态 知识 和 相对 知识 。 


» 


职 官 是 指 在 国家 机 构 中 担任 一 定 职务 ,参与 国家 
管理 ,运行 相关 工作 ,有 着 不 同 职位 .职权 范围 和 地 位 
等 级 的 一 类 人 群 的 统称 ” 。 本 文 研究 的 职 官 特 指 清 代 
职 官 。 在 我 国 古代 皇权 统治 下 的 封建 社会 , 职 官 辅佐 
星 帝 对 国家 政治 ` 经 济 .军事 文化 等 各 方面 进行 管理 。 
因此 ,对 该 领域 人 文 资 源 的 开发 不 仅 有 助 于 对 当时 职 
谨 制 度 的 研究 ,还 可 以 透 过 诸如 职 官 任免 等 信息 ,拓展 
研究 这 一 历史 时 期 的 政治 制度 、 职 官 治理 下 的 经 济 发 展 
水 平 . 社 会 生产 力 水 平民 族 文 化 特点 等 。 在 当前 数字 
人 文 研究 视角 下 ,依托 信息 技术 对 体 量 巨大 、\ 种 类 繁杂 
的 职 官 资 源 展开 研究 ,可 以 更 为 高 效 地 对 分 散 化 、 碎 片 
化 的 知识 单元 进行 细 粒 度 组 织 和 管理 ,从 而 实现 资源 的 
深度 开发 和 利用 ,丰富 我 国 职 官 领域 资源 知识 研究 框 
架 , 推 动 职 官 研究 朝 数 字 化 .语义 化 智慧 化 方向 发 展 。 
因此 ,本 文 以 清 代 职 官 为 切入 点 ,结合 本 体 理 论 与 
技术 方法 ,通过 领域 本 体 概念 框架 模型 来 系统 表征 该 
领域 内 的 知识 及 知识 单元 之 间 的 联系 与 结构 。 并 以 
《长 春 县 志 “' 长 春 职 官 考释 表 》 为 例 ,构建 本 体 实 例 ， 
实现 领域 知识 表述 和 关联 的 可 视 化 ,为 数字 人 文 背 景 
下 清 代 职 官 主题 数字 资源 的 深度 开发 和 高 效 利用 提供 
理论 与 实践 支撑 。 
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2 文献 回顾 


数字 人 文 研究 的 历史 最 早 可 以 追溯 至 1949 年 , 布 
萨 团队 与 IBM 合作 ,将 文本 与 计算 相 结合 ,成 功 地 为 
意大利 著名 的 哲学 家 和 神学 家 阿 奎 那 1 000 多 万 字 的 
拉丁 文 作品 做 了 编制 索引 中 。 近 20 年 来 ,数字 人 文 作 
为 一 个 新 兴学 科 , 日 渐 凸 显 其 活跃 性 。 研 究 主题 主要 
聚集 在 数字 人 文 的 基础 设施 和 关键 技术 、 数 字 人 文 的 
基础 理论 与 应 用 实践 图 情 档 领 域 与 数字 人 文 的 结合 
以 及 面向 数字 人 文 的 教育 与 服务 4 个 方面 。 国 内 外 学 
者 针对 数字 人 文 视角 下 的 知识 组 织 研究 形成 了 一 定数 
量 的 成 果 。 

国内 学 者 借助 本 体 实现 知识 组 织 的 研究 成 果 主要 
聚焦 于 文史 教育 .医学 .文化 等 领域 ,如 周 莉 娜 等 设计 
唐诗 本 体 模型 ,利用 从 Web 上 让 取 的 多 源 异 构 数 据 ， 
乘 用 知识 抽取 .知识 融合 知识 推理 等 技术 自动 构建 唐 
评 知 识 图 谱 ,并 搭建 基于 唐诗 知识 图 谱 的 智能 知识 服 
多 各 Know-Poetry5 。 刘 宁静 等 调研 分 析 FOAF 、CB- 
DB 上 海 图 书馆 名 人 手稿 档案 资源 知识 模型 和 学 术科 
研 膏 息 资源 CERIF 等 4 类 以 人 物 为 核心 的 特色 资源 库 
知 这 异型 ,构建 学 术 名 人 描述 框架 模型 和 学 术 名 人 与 
其 友 实 体 关系 模型 " 。 腾 春 娥 、 王 萍 根据 非 遗 领域 相 
关 漠 源 类 型 确立 采用 的 元 数据 标准 ,结合 DC 元 数据 
确定 本 体 中 每 个 概念 属性 的 核心 元 素 集 , 并 构建 赫哲 
j 址 资源 体系 "” 。 修 西 龙 等 构建 了 非 遗 知识 本 体 模 
型 按照 本 体 模型 对 实体 进行 RDF 化 属性 描述 ,建立 


实体 链接 , 并 选择 合适 的 数据 存储 与 发 布 平台 为 人 机 
气候 访问 和 数据 接口 9% 。 何 超 , 张 玉 峰 构建 了 基于 本 
体 的 馆藏 资源 语义 聚合 与 可 视 化 模型 ,探讨 了 模型 中 
各 个 模块 的 主要 功能 以 及 模型 实现 过 程 中 的 关键 环节 
和 方法 ”。 目 前 国内 将 数字 人 文 与 地 方志 ,如 县 志 、 州 
志 等 结合 的 研究 鲜 少 ,相关 研究 主要 体现 在 元 数据 策 
略 探讨 "9 ,知识 库 构建 ,地 名 自动 识别 模型 构建 
等 方面 ;而 有 关 职 官 领域 的 研究 则 更 多 倾向 于 对 各 时 
期 各 地 方 的 职 官 制度 进行 研究 ,如 科举 教育 与 捐 官制 
度 之 间 的 关系 ,引见 制度 和 密 折 检查 制度 数字 信息 


san 探讨 了 尼日利亚 土著 文化 遗产 本 体 模 型 和 知识 结 
构 “! ,D. Marilena 等 提出 政治 角色 (PRoles ) 本 体 论 , 同 
时 基于 已 有 的 本 体 论 模型 (如 出 版 角色 本 体 论 (PRO ) ， 
出 处 本 体 论 (PROV-0 ) 和 多 元 参与 本 体 论 ) 构建 全 新 
政治 角色 和 相关 事件 关系 的 本 体 模型 ”| 。J. Plisson 
等 提出 了 一 个 大 型 协作 网 络 组 织 (collaborative net- 
worked organizations ,CNOs ) , 即 VBE (virtual organization 
breeding environment ) ,以 识别 特定 类 型 网 络 中 的 参与 
者 和 关系 。G. Prokopiadou 等 分 析 了 本 体 在 电子 政 
务 信 息 资源 开发 应 用 中 所 具有 的 优势 ,并 实现 了 基于 
本 体 的 政务 信息 资源 知识 组 织 ” 。D. Riano 等 介绍 了 
一 种 用 于 慢性 病 患者 护理 的 本 体 , 可 以 自动 为 医疗 专 
业 人 员 提 供 该 患者 有 关 的 临床 信息 ,该 本 体 用 作 决 策 
支持 工具 的 知识 库 ,可 帮助 医疗 专业 人 员 检 测 异 常情 
况 , 例 如 错误 的 诊断 等 ” 。 

由 此 可 见 ,本 体 作为 重要 研究 方法 被 国内 外 广泛 
应 用 于 对 领域 知识 进行 分 类 表达、 整合 .共享 和 重用 。 
学 者 们 虽然 不 再 局 限于 传统 的 单 维 线性 知识 组 织 模 
式 , 通 过 构建 本 体 模 型 逐渐 趋向 基于 语义 的 知识 细 粒 
度 表 述 和 多 维 关联 发 展 ,实现 人 文 领域 知识 服务 驱动 
的 资源 开发 ,满足 了 各 领域 用 户 日 益 提 高 的 信息 需求 
层次 ,但 是 仍 欠 缺 将 数字 人 文 与 职 官 研究 的 互通 性 与 
共 融 性 的 探索 , 职 官 领 域 研究 的 稀缺 致使 大 量 可 挖掘 
利用 的 职 官 知识 隐藏 在 浩如烟海 .分散 杂 乱 的 数字 资 
源 中 ,这 一 领域 正 遗 荒 待 明 且 有 较 强 的 发 展 潜力 。 

故而 , 牢 牢 把 握 数 字 人 文 这 一 变革 机 遇 ,提供 特定 
领域 内 可 以 被 广泛 认可 和 接受 且 便 于 共享 的 概念 词 
表 , 是 实现 职 官 领域 知识 单元 的 结构 化 组 织 和 语义 化 
关联 的 有 效 手 段 。 因 此 ,本 文 将 本 体 作为 研究 工具 , 构 
建 清 代 职 官 领 域 本 体 模 型 ,同时 辅 以 实例 可 视 化 实现 
资源 的 高 效 组 织 与 整合 ,展现 数据 到 信息 再 到 知识 的 
多 角度 \ 深 层次、 高 质量 服务 ,有 助 于 领域 学 者 开展 深 
层次 的 人 文 研 究 , 同 时 也 能 丰富 数字 人 文 领域 有 关 职 
官 资源 的 知识 研究 。 


3 ” 清 代 职 官 领域 本 体 模型 构建 


化 整合 ” ;并 且 在 相关 研究 中 利用 本 体 实现 职 官 知识 
组 织 的 研究 寥寥 无 儿 , 仪 有 郭 建 伟 针 对 《 四 库 全 书 总 
目 》 史 部 的 职 官 类 进行 本 体 构 建 以 实现 职 官 类 数字 目 
录 的 语义 关联 的 研究 。 

对 国外 相关 文献 阅读 可 知 ,虽然 国外 研究 鲜 少 注 
入 职 官 概念 ,但 是 却 将 本 体 逐 渐 拓 展 应 用 于 工程 、 生 
物 \ 医 疗 、 图 书馆 政务 教育 、 农 业 等 领域 。J. A. Has- 


基于 本 体 的 知识 组 织 ,其 核心 和 基础 为 构建 本 体 
模型 ,把 某 一 主题 涉及 的 概念 和 关系 用 模型 形式 化 结 
构 化 地 表达 出 来 ” ,从 而 提出 被 普遍 认可 和 接受 、 便 
于 共享 和 重用 、 且 机 器 可 读 的 概念 模型 。 本 体 的 构建 
要 遵循 五 条 原则 :明确 性 .一致 性 .可 扩展 性 .最 小 编码 
诊 差 和 本 体 承诺 最 小 化 。 具 体 的 数字 人 文 视 角 下 
本 体 驱 动 的 清 代 职 官 知识 组 织 流程 如 下 : 


19 


国定 情报 三 作 


第 64 卷 第 17 期 2020 年 9 月 


ChinaXiv 合 作 期 刊 


3.1 本体 构 建 领 域 .范围 及 复 用 本 体 的 确定 

正式 构建 本 体 之 前 ,首先 需 明确 本 体 的 领域 和 范 
围 , 即 研究 对 象 为 清 代 职 官 领域 知识 ,建立 强 针对 性 和 
扩展 性 的 清 代 职 官 领域 本 体 模型 ,并 经 综合 考虑 , 拟 部 
分 复 用 已 有 的 、 较 为 成 熟 的 本 体 , 既 可 以 充分 利用 已 有 
本 体 ,实现 知识 的 共享 和 重用 ,又 可 以 避免 不 必要 重复 
构建 。 本 文 复 用 的 4 个 本 体 有 :FOAF 本 体 ,表示 为 带 
有 前 级 foaf, 如 foaf:name; 上 海 图 书馆 本 体 服务 中 心 
上 的 CBDB 本 体 和 家 谱 本 体 ,表示 为 带 有 前 缀 shl ,如 
shl :nativePlace; Relationship 本 体 ,表示 为 带 有 前 级 
rel ,如 rel:brotherOf。 同 时 本 文 结合 清 代 职 官 特点 , 自 
定义 了 部 分 本 体 ,表示 为 带 有 前 级 各 ,如 jlu: hasEv- 
ent。 为 了 清楚 直观 地 区 分 类 和 属性 ,下 文中 上 角 标 。 
代表 类 ,上 角 标 op 代表 对 象 属性 ,上 角 标 dp 代表 数据 
上 过。 
3 人 AN 清 代 职 官 数据 采集 与 预 处 理 
志 全 面 采集 所 需 清 代 职 官 相关 数字 资源 ,为 构建 一 
人 贸 疼 合理 的 清 代 职 官 领域 本 体 及 实例 的 添加 葛 定 基 
而 本 研究 以 (长 春 县 志 ' 长 春 职 官 考释 表 》 为 数据 
源 忆 (长 春 县 志 :长春 职 官 考释 表 》 虽 以 数字 格式 存 
全 但 并 未 建 库 ,因此 区 别 于 机 器 自动 抽取 方法 ,本 文 
习 国人 工 抽取 方法 共 获 取 164 条 清 代 职 官 任职 信息 ， 
辩 济 硕 包 括 担 任 具体 官职 的 职 官 姓名 字 出 身 . 任 职 
年 臣 籍贯 . 奏 请 ( 朱 批 ) 时 间 、 任 职 时 间 和 任职 方式 。 
阱 和 ,笔者 通过 查阅 CBDB 《 清 代 吉林 档案 史料 选编 》 
《清史 稿 ) 等 档案 文献 ,有 针对 性 地 检索 ,予以 补充 ,如 
增 深 官 职 品级 .离职 时 间 等 信息 以 此 丰富 与 完善 职 官 
信息 。 数 据 采集 后 ,结合 清 代 职 官 特 点 ,对 数据 进行 预 
处 理 。 将 重复 的 ,无 用 信息 剔除 ,反复 校对 甄别 后 ,以 
职衔 为 中 心 ,将 描述 同一 官职 的 信息 进行 挑选 . 归 类 、 
整理 。 整 理 后 的 部 分 信息 如 表 1 所 示 : 

表 1 采集 到 的 部 分 清 代 职 官 信息 


息 类 别 信息 内 容 
官职 。 长 春 府 知府 .长 春 厅 抚 民 通 判 , 审 判 厅 厅 长 ,检察 厅 厅 长 .长 春 

县 理事 通 判 . 巡 检 , 经 历 ,分 防 农安 照 磨 , 分 防 靠山 屯 照 磨 , 分 防 

朱 家 城 昭 磨 ,训导 教授 

人 物 。” 何 厚 琦 ,六 雅 图 , 阿 成 . 那 灵 泰 , 庆 符 、 萨 呢 扬 阿 、 双 全 , 善 庆 , 觉 
罗 同 励 文 查 、 谢 涩 饮 、 周 炳 南庄 以 临 \, 文 霖 \ 冯 诚 求 , 章 绍 泊 、 
丁 元 秉 王 迎 寿 、 李 荣 芬 .长 青 、 钟 产 . 王 鸣 珂 …… 

出 身 文章 ,监生 ` 贡 生 、 副 贡生 生 员 、 翻 译 生 员 、 翻 译 举人 、 官 学 生 
成 在 辛 西 科举 人 咸丰 两 展 科 进士 .成 让 已 未 恩 科举 人 ,学 习 

贴 式 ,光绪 乙 西 年 拔 贡 光绪 甲午 恩 科 进士 光绪 乙未 科 进 了 

光绪 两 成 进士 ,光绪 丁丁 科举 人 ,举人 \ 岁 贡 、 进 士 \ 凋 生 , 现 

任职 方式 “兼职 、 署 职 ` 署 理 , 代 理 . 加 街 . 护 理 \ 借 补 ` 差 委 、 额 外 任用 ,革职 

留任 、 补 授 ( 实 任 ) .候补 


上 曲 ， 


受 篇 幅 所 限 , 其 他 采集 到 的 描述 清 代 职 官 的 信息 
资源 ,如 官职 的 别名 、 品 级、 类 别 \ 人 物 的 字号. 谥 号 、 
民族 、 旗 籍 .籍贯 . 生 搬 年 , 葵 年 任职 年 龄 .任职 的 奏 请 
( 朱 批 ) 时 间 任职 时 间 离职 时 间 等 ,不 在 表 1 中 一 一 
列举 。 

3.3 ”模型 构建 

3.3.1 类 的 构建 

概念 是 领域 本 体 的 核心 和 基础 ,本 体 模型 的 根本 
目的 在 于 为 某 一 特定 领域 提供 被 广泛 接受 .认可 和 便 
于 重用 共享 的 概念 体系 。 本 文 根 据 所 收集 到 的 数据 ， 
结合 清 代 职 官 特点 和 数字 人 文 环 境 下 知识 服务 需要 ， 
梳理 提炼 并 列举 相关 概念 和 重要 术语 ,将 其 中 具有 综 
合 性 和 概括 性 的 核心 概念 作为 本 体 的 类 。 因 此 ,有 关 
于 职 官 本 人 ,任职 事件 和 官职 本 身 的 信息 是 最 为 核心 
且 必 不 可 少 的 ,是 独立 的 类 。 其 他 与 其 联系 紧密 且 内 
涵 丰 富 独 特 的 核心 概念 也 设 为 独立 的 类 ,包括 与 人 物 
本 身 相关 的 出 身 和 籍贯 (表示 为 地 点 类 ) ;与 官职 有 关 
的 官职 品级 和 官职 类 别 ;与 特定 任职 事件 相关 的 任职 
方式 和 任职 离职 时 间 等 。 此 外 ,八旗 制度 是 具有 时 代 
特色 的 清朝 根本 制度 之 一 ,统治 者 借助 八旗 制度 对 国 
家 政治 .军事 .生产 文化 等 方方面面 进行 管理 , 它 是 清 
王朝 政治 管理 体系 支柱 和 命运 共同 体 。 可 见 旗 籍 是 清 
代 职 官 很 重要 的 特有 属性 ,是 不 同人 物 相 互 关联 的 纽 
带 。 因 此 ,也 将 其 作为 单独 的 类 。 同 时 ,把 与 旗 籍 息 息 
相关 的 民族 也 算 作 单独 的 类 ,最 后 形成 11 个 大 类 ,如 
1 和 表 2 所 示 : 


旗 逢 一 
Sa 一 时 间 
民族 一 、 \ / 
NAN /一 任职 方式 
出 身 We / 
bE 一 一 任职 事件 
RD 
~ \ 一 芯 
地 点 / 
4 一 官职 类 别 
官职 品级 一 


图 1 清 代 职 官 领域 本 体 的 类 


3.3.2 属性 的 构建 

从 核心 概念 展开 ,将 梳理 得 到 的 其 他 概念 根据 其 
自身 内 涵 和 本 体 的 功能 需要 进行 分 析 、 归 类 、 整 理 , 转 
换 成 已 有 类 的 属性 。 本 体 属性 的 构建 是 一 个 复杂 而 关 
键 的 部 分 ,分 为 对 象 属性 数据 属性 和 注释 属性 。 

本 体 的 类 间 关 系 是 由 对 象 属性 进行 定义 和 描述 
的 ,对 象 属 性 的 定义 域 和 值 域 都 是 该 本 体 的 类 。 构 建 
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表 2 清 代 职 官 领域 本 体 的 类 及 说 明 
类 标签 解释 说 明 
jlu:Person © 人 物 描述 一 个 人 的 具体 信息 ,包括 姓名 、 民 族 、 字 、 号 \ 籍 贯 等 
jlu: Origin © 出 身 最 初 入 仕 的 身份 
shl:Place © 地 点 官员 的 籍贯 
jlu: NativeBanner © 旗 籍 旗 人 的 户籍 ,标志 着 他 的 身份 地 位 和 人 旗 前 的 民族 成 分 
jlu: Ethnicity © 民族 某 人 所 属 的 民族 ,比如 汉族 满族 .蒙古 族 等 
shl: OfficialEvent © 任职 事件 一 次 任职 经 历 ,包括 职衔 \ 时 间 \ 任 职 方式 \ 任 职 年 龄 等 信息 
jlu:OfficiaWay © 任职 方式 担任 某 官职 的 方式 
shl: Temporal © 上 时间 某 人 某 次 任职 事件 中 所 涉及 到 的 时 间 ,包括 奏 请 朱 批 时 间 ,任职 时 间 和 离职 时 间 
sh1;OfficialPosition © 官职 具体 描述 某 官职 的 信息 
jlu: OfficialRank © 官职 品级 古代 官职 的 等 级 
jlu: OfficialCategory © 官职 类 别 古代 官职 所 属 的 是 文职 或 武 职 . 是 京 官 或 外 官 


的 对 象 属性 见 表 3。 通 过 对 象 属性 将 独立 的 知识 单元 
联系 起 来 ,揭示 知识 单元 间 丰 富 复 杂 、 多 维 动态 的 关 
系 各 使 知识 组 织 和 管理 模式 由 单 维 线性 向 网 络 化 转 
变 \ 数 据 属性 是 对 类 自身 信息 的 补充 和 完善 ,从 属性 
纺 医 进一步 描述 类 的 特征 , 直 富 类 的 内 洱 。 定 义 域 是 


本 体 模 型 中 定义 的 类 , 值 域 是 待 填写 的 字符 串 
(string) 。 属 性 的 建立 ,明晰 和 确定 了 概念 体系 结构 以 
及 概念 之 间 的 语义 关系 ,为 实现 推理 及 基于 语义 的 信 
息 检 索 英 定 基础 。 


© 表 3 对 象 属性 及 说 明 
< 让 对 象 属性 说 明 对 象 属性 说 明 
© jlu: hasEventoP 有 事件 rel : grandparentOfoP 孙子 
CGO) jlu:atTime®P 时 间 是 jlu:uncleOfP 侄子 
2 jlu:hasNativeBanner°P 所 属 旗 rel : parentOf°P 子女 
GAN jhu:hasOriginop 出 身 是 jhu:parentinlawOfo 女婿 
四 jlu:categoryOfoP 类 别 是 jlu :brotherOfoP 兄弟 
上 之 jlu:rankOfop 品级 是 rel :childOf°P 父母 
>< jhu:holdOfficeoP 担任 jhu :soninlawOfop 岳父 母 
© jlu:throughTheWayOf°P 通过 jlu: nephewOf°P 叔叔 
n SS jlu: greatgrandparentOf°P 曾孙 jlu : grandsonOf°P 祖父 
es rel: mentorOf°P 门生 jlu :greatgrandsonOfop 曾祖 父 
© jlu: discipleOf°P 老师 jlu: biconditionalgateOf°P 同门 
jlu :fellowtownsmanOf°P 同乡 


构建 完成 的 本 体 模 型 可 视 化 见 图 2。 其 中 ,汉字 
后 带 c 的 节点 是 类 ,其 余 节 点 是 数据 属性 , 连 线 上 的 是 
对 象 属性 。 由 于 该 本 体 人 物 间 的 社会 关系 多 达 15 种 ， 
为 了 模型 的 清晰 直观 ,将 人 物 类 的 表示 社会 关系 的 属 
性 单独 展示 , 见 图 3。 

以 人 物 类 为 例 ,参见 图 2 和 图 3 可 知 该 类 共 定 义 
了 20 个 对 象 属性 和 7 个 数据 属性 。 其 对 象 属性 既 有 
由 它 指向 其 他 类 的 ,描述 该 类 与 其 他 类 之 间 的 关系 ,如 
属性 shl :nativePlace ,定义 域 人 物 类 , 值 域 地 点 类 ,表示 
某 人 与 某 地 之 间 存 在 的 一 种 籍贯 联系 ,也 有 由 人 物 类 
指向 其 自身 的 对 象 属性 ,这 里 指 的 是 人 物 之 间 社 会 关 
系 , 如 父子 ,老师 .同乡 等 。 人 物 类 的 数据 属性 有 姓名 、 
字号 . 谱 号 .生辰 年 \ 卒 年 和 备注 ,是 对 人 物 自身 信息 


的 补充 和 说 明 。 属 性 和 类 共同 构成 清 代 职 官 领域 本 体 
的 概念 体系 结构 ,从 而 实现 语义 关联 的 、 细 粒度 的 知识 
表达 与 共享 ,为 提供 智慧 化 .个 性 化 的 知识 服务 葛 定 基 
础 。 

此 外 ,还 有 注释 属性 可 以 为 类 、 对 象 或 者 数据 属性 
添加 信息 ,类似 于 元 数据 的 功能 ,是 “数据 的 数据 ”|。 
本 文 构建 的 清 代 职 官 领域 本 体 针 对 每 一 个 类 、 对 象 和 
数据 属性 ,都 利用 protégé 自 带 的 comment 属性 做 以 解 
释 说 明 ,便于 本 体 的 理解 .共享 和 重用 。 

根据 上 述 体系 结构 ,利用 protégé 建 模 清 代 职 官 领 
域 本 体 ,该 开源 软件 自 带 插件 库 且 支持 多 种 文件 格式 ， 
是 应 用 较 广 泛 的 本 体 建 模 软件 。 并 以 OWL 文件 格式 存 
储 ,OWL 在 表达 含义 和 语义 方面 比 XML、RDF 和 RDFS 
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任 贡 洲 式 
奏 请 朱 批 从 纪年 时 间 入 省 
奏 请 朱 批 人 纪年 时 间 Eh 
任 员 式 e 
任职 公开 年 时 间 ey { jlu:hasNativeBanner Ye 
JiuhasUrien 
离职 公有 年 时 间 生 企 年 靖 时 
rm 一 时 爸 Cc 等 一 
jlu: throughTheNayOf Co - ， 镍 
， ee jlu:hasEthnicity 
离职 年 玩 记 年 时 间 
人 畏难 shl :nat A E 丸 
由 jlu:hasEvent & 
任职 哮 件 c 千 、 
地 
jlu:hol doffice 
ge 地 
Wi 
$1u:categoryof 闭 
jlu;rankOf 
官职 种 级 c 
5 地 官网 别 
于 一 官员 级 
ON 官 现 别 
© 图 2 本 体 类 和 属性 可 视 化 
OO 
村 jlu: greatgrandparentOPP 
< 十 rel: grandparentOfPF 
©O Jlu: uncleOf s 
CD rel:parentOf? 
CN jlu:parentinlawOfPF 
© jlu: brotherOfee 
CN relchildOf=P 
ee 人 物 A jlu: soninlawOf=P 人 物 B 
2 jlu: nephewOfF 
>< jlu: grandsonOfP? 
二 jlu: greatgrandsonOfP 
rel:mentorOfeP 
CS jlu:discipleOfPP 
四 Jlu: biconditionalgateOf? 
O jlu: fellowtownsmanOf°? 


图 3 表示 社会 关系 的 属性 


有 更 多 的 表达 手段 ,在 Web 上 表达 机 器 可 理解 内 容 的 
能 力 比 这 些 语言 强 ” 。 构 建 的 部 分 本 体 模 型 见 图 4 ， 
部 分 代码 见 图 5。 

3.4 ”实例 添加 与 可 视 化 

3.4.1 实例 添加 

所 向 领域 本 体 模型 的 清 代 职 官 知 识 组 织 和 管理 ,不 
仅仅 是 设计 和 建立 一 个 知识 聚合 和 存 贮 的 结构 化 、 可 扩 
展 的 体系 框架 ,更 重要 的 是 描述 清 代 职 官 相关 数字 资源 
内 会 的 丰富 知识 以 及 揭示 知识 单元 间 复 杂 的 动态 联系 。 
本 文 以 (长 春 县 志 “' 长 春 职 官 考释 表 》 为 例 , 在 已 构建 的 
框架 下 ,从 收集 到 的 数字 资源 中 选取 代表 性 人 物 进行 实 
例 添 加 。 实 例 添 加 是 本 体 构建 的 重要 步骤 ,是 知识 组 织 
的 具体 应 用 ,是 需要 满足 用 户 实际 的 检索 需求 。 


本 体 实例 化 运用 的 是 protégé 中 的 mdividuals 模 
块 ,为 已 经 定义 完成 的 类 填充 相应 的 实例 ,并 为 实例 的 
属性 进行 赋值 ,通过 属性 进一步 完善 实例 ,搭建 并 描述 
个 体 与 个 体 之 间 的 语义 联系 ,以 检验 本 体 的 合理 性 和 
可 用 性 。 

为 了 实例 可 视 化 和 检索 的 清楚 直观 ,避免 实例 名 
出 现 重复 错误 ,本 文 直接 以 体现 个 体 自身 涵义 和 存在 
的 名 称 符号 作为 实例 名 ,如 采用 具体 的 姓名 “ 孙 堪 ”为 
人 物 类 的 实例 命名 ,采用 “署理 "为 任职 方式 类 的 实例 
命名 等 。 同 时 考虑 到 同一 人 物 可 能 有 不 止 一 段 任职 经 
历 ,将 任职 事件 类 实例 命名 为 "人 名 + 数字 ”, 对 应 的 
时 间 类 的 实例 命名 为 ”人 名 + 时 间 + 数字 ”。 构 建 的 
具体 实例 及 其 所 属 的 类 见 图 6。 
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一 国 jlu:grandsonOf 
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一 国 jlu:categoryoOf 

一 国 jlu:discipleof 
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Reflexive 


elm eel 


Irreflexive 


4 ”本 体 模型 部 分 展示 


<AnnotationAssertion> <AnnotationProperty abbreviatedIRI=”rdfs:comment”/> 
<IRI>#jlu:_officialCategory</IRI> <Literal datatypeIRI=”"&rdf;PlainLiteral”) 官 
职 所 属 的 类 别 ， 是 文官 还 是 武官 ， 京 官 还 是 外 官 。</Literal> </AnnotationAssertion> 
“AnnotationAssertion> <AnnotationProperty abbreviatedIRI=”rdfs:label”/> 
<IRI>#jlu:_officialCategory</IRI> <Literal datatypeIRI=“&rdf;PlainLiteral”) 官 职 
类 别 </Literal> </AnnotationAssertion> <AnnotationAssertion> 
<AnnotationProperty abbreviatedIRI=“rdfs:comment /> <IRI>#jlu:alias</IRI> 
《Literal datatypeIRI=“&rdf;PlainLiteral“> 官 职 的 别名 。 《/Literal> 
</AnnotationAssertion> <AnnotationAssertion> <AnnotationProperty 
abbreviatedIRI=”rdfs:label”/> <IRI>#jlu:alias</IRI> <Literal 
datatvpeIRI="&rdf;PlainLiteral” 别名 </Literal> </AnnotationAssertion> 
<AnnotationAssertion> <AnnotationProperty abbreviatedIRI=”rdfs:comment” /> 
<IRI># jlu:atTime</IRI> 《<Literal datatypeIRI=“&rdf;PlainLiteral”) 某 一 任职 事件 所 
涉及 到 的 时 间 。 《/Literal> </AnnotationAssertion> <AnnotationAssertion> 
<AnnotationProperty abbreviatedIRI=”rdfs:label”/> <IRI>#jlu:atTime</IRI> 
<Literal datatypeIRI=“&rdf;PlainLiteral“ > 时间 是 </Literal> </AnnotationAssertion> 


5 本 体 的 部 分 代码 
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6 本 体 实例 
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3.4.2 实例 可 视 化 

对 构建 完成 的 实例 采取 可 视 化 处 理 ,将 多 维 关联 
的 知识 单元 直观 化 ,图谱 化 呈现 ,便于 知识 的 理解 和 利 
用 ( 见 图 7、 图 8)。 以 职 官 “ 孙 堪 ” 为 例 ,其 任职 经 历 较 
为 丰富 , 曾 先 后 担任 长 春 厅 抚 民 通 判 和 长 春 府 知府 , 具 
体 的 可 视 化 结果 见 图 7, 其 中 实 线 代 表 以 对 象 属性 连 
接 , 虚 线 代表 以 数据 属性 连接 。 根 据 已 经 确定 下 来 的 
领域 本 体 模 型 及 采集 到 的 职 官 孙 堪 信息 资源 ,在 每 个 
类 下 都 创建 了 实例 并 进行 属性 赋值 , 即 方块 中 的 内 容 。 


通过 结构 化 ,形式 化 .知识 细 粒度 聚合 的 方式 一 目 了 然 
地 描绘 出 一 段 非 结构 化 语义 信息 :汉族 ,咸丰 两 辰 科 进 
士 出 身 的 直 隶 清 苑 人 孙 堪 曾 在 52 岁 时 以 代理 的 方式 
担任 正六 品 的 文职 外 官 一 一 长 春 厅 抚 民 通 判 , 奏 请 朱 
批 时 间 是 光绪 十 六 年 八 月 初 一 ,任职 时 间 是 光绪 十 六 
年 六 月 十 七 日 , 皆 为 1890 年 , 孙 堪 的 第 二 次 任职 事件 
同 理 。 可 见 基于 本 体 的 知识 组 织 和 管理 更 有 利于 机 器 
和 人 对 清 代 职 官 领域 知识 进行 理解 和 操作 ,降低 了 检 
索 难度 的 同时 提升 了 检索 结果 的 关联 性 和 有 效 性 。 


长 春 府 知府 lu:categoryOf 
jlu:rankOf , 
60 岁 
jlu:holdOffice 
Jlu:officialAge 。 jluthroughThe 
WayOf jlu:categoryOf 
正六 品 
™ 
> jlu:hasEvent EY Peaton 
atTime 长 春 厅 抚 民 通 判 
ia 医 开 到 
ti lu.hasEthnicity jlu:hasOrigin shl:nativePlace 
CN 孙 堪 时 间 2 E Hos jlu'hasEvent jluholdoffice 
Te 人 [ER | (ER 人 
奏 请 朱 批 年 号 纪年 时 间 : R 
© 光绪 十 六 年 八 月 初 一 日 jluatTime 
已 任职 公元 纪年 时 间 : Ne 
1890 年 Gat Way jiu:officialAge 
< 十 任职 年 号 纪年 时 间 : 孙 堪 时 间 1 
© 光绪 十 六 年 六 月 十 七 日 于 请 朱 批 公元 纪年 时 间 : 
《0 旨 计 失 批 年 号 纪年 时 间 
光绪 十 六 年 八 月 初 一 日 
2 任职 人 于 纪 和 时间 
1890 
GAN 任职 年 号 纪年 时 间 : 
~ 光绪 十 六 年 六 月 十 七 日 
> < 7 ”本体 单个 人 物 实例 可 视 化 
a 


它 而 且 , 基 于 本 体 模型 的 清 代 职 官 知识 组 织 的 优越 


实现 语义 层次 的 深度 关联 与 知识 聚合 ,提高 了 知识 检 


性 企 但 在 于 实现 资源 的 结构 化 表述 和 语义 关联 ,更 在 
于 加 以 通过 创立 大 量 相互 关联 、 互 为 补充 的 实例 ,逐步 
建立 起 该 领域 的 知识 库 ” 。 图 8 是 孙 堪 、 善 庆 、 那 灵 
泰 三 个 人 的 实例 可 视 化 展示 ,具体 个 人 实例 展开 如 前 
所 述 ,在 此 不 再 歼 叙 。 描 述 不 同人 物 的 信息 资源 可 以 
指向 相同 的 实例 ,从 而 将 不 同 来 源 ,不 同 内 容 主题 的 清 
代 长 春 职 官 相关 数字 资源 关联 起 来 ,将 分 散 异 构 、 复 杂 
交错 的 领域 知识 集成 于 统一 的 框架 之 下 。 如 从 图 8 中 
我 们 看 到 孙 堪 和 善 庆 都 曾 担任 过 长 春 厅 抚 民 通 判 . 都 曾 
以 署理 的 方式 在 长 春 任职 ; 善 庆 和 那 灵 泰 都 是 满族 正 折 
旗 人 、 都 曾 担任 过 长 春 县 理事 通 判 ;而 孙 堪 和 那 灵 泰 都 
与 善 庆 关联 ,所 以 他 们 之 间 也 存在 一 条 间接 关联 路 径 。 
针对 本 文 构建 的 任何 两 个 实例 ,都 能 通过 不 同 的 路 径直 
接 或 间接 的 联系 起 来 ,形成 清 代 长 春 职 官 知识 网 络 。 

本 文 对 构建 完成 的 本 体 实现 基本 查询 ,如 以 “长 春 
府 知府 "为 检索 词 ,检索 结果 见 图 9, 将 与 检索 主题 相 
关联 的 主题 共同 呈现 出 来 ,提供 基于 语义 的 知识 导航 ， 


索 效 率 , 方 便 用 户 找到 可 能 感 兴趣 的 其 他 相关 联 的 资 
源 ,实现 资源 的 次 度 挖掘 、 开 发 利用 。 


4 总 结 


1 一口 


知识 组 织 的 最 终 目 标 是 通过 检索 等 手段 使 用 户 以 
最 便捷 的 方式 获取 所 需要 的 信息 和 知识 。 但 是 随 着 信 
息 技 术 的 快速 发 展 和 需求 层次 的 不 断 提 高 ,传统 的 基 
于 元 数据 的 关键 词 检索 方式 早已 不 能 满足 用 户 日 益 复 
杂 多 样 的 信息 需求 ,语义 层面 上 的 知识 管理 和 服务 模 
式 走 进 大 众 视 野 。 我 国 古代 职 官 相关 数字 资源 蕴含 着 
丰富 的 知识 ,是 我 国 重 要 的 人 文 资源 和 历史 记忆 。 但 
是 该 领域 内 的 知识 重用 率 偏 低 , 缺 乏 对 领域 知识 深层 
次 .系统 性 的 组 织 和 开发 。 

本 文 在 梳理 清 代 职 官 知识 特点 和 框架 的 基础 上 ， 
构建 本 体 模型 ,实现 了 领域 知识 细 粒 度 结构 化 .语义 
化 的 表达 和 描述 ,揭示 了 知识 单元 间 多 层次 、 多 维度 、 

富 复杂 的 动态 关系 ,使 相互 关联 的 知识 可 以 被 准确 
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图 8 本 体 多 人 物 实例 可 视 化 
™ 
CN 
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© 
2 图 9 查询 “长 春 府 知府 ”的 结果 可 视 化 


本 识别 和 定位 5 ,从 而 更 好 地 满足 学 者 和 社会 大 
众 殉 此 类 资源 研究 和 利用 的 需求 ,并 以 (长春 县 志 ' 长 
春 恒 官 考释 表 》 为 例 进行 实例 的 填充 和 可 视 化 。 从 任 
意 风 多 出 发 ,都 可 以 通过 不 同 的 关联 路 径 , 层 层 递 进 式 
与 其 他 实例 相关 联 ,呈现 出 一 幅 动态 变化 的 知识 网 络 ， 
能 有 效 助 推 数字 人 文 视角 下 职 官 主题 资源 研究 范式 的 
变革 ,促进 该 领域 数字 资源 的 深度 开发 和 全 面 利 用 , 推 
动 领域 知识 管理 和 服务 模式 创新 。 同 时 ,为 感 兴趣 的 
学 者 和 机 构 开 发 蕴含 职 官 知识 的 数字 资源 提供 实践 经 
验 和 参考 ,有 助 于 机 构 提 升 知识 服务 质量 和 知识 创新 
能 力 , 扩 大 社会 知名 度 和 影响 力 。 

本 研究 构建 的 职 官 本 体 模型 能 揭示 知识 单元 关 
系 ,帮助 用 户 检索 潜藏 的 知识 信息 ,在 理论 与 实例 上 证 
明了 数字 人 文 技术 方法 对 职 官 研究 、 揭 示人、 地 、 事 、 时 
等 知识 关联 的 可 行 性 和 有 效 性 。 笔 者 认为 ,未 来 数字 
人 文 在 职 官 领域 的 应 用 研究 可 从 以 下 四 个 方面 继续 深 
入 :一 是 在 保证 本 体 模型 科学 合理 、 准 确 完 整 的 原则 
下 ,不 断 丰 富 和 优化 本 体 的 类 和 属性 ,充实 完善 已 有 概 
念 ,扩展 新 的 概念 ,使 本 体能 够 实时 有 效 地 覆盖 特定 领 


域内 的 知识 ,实现 本 体 模型 在 实际 研究 和 应 用 中 由 简 
到 让、 反复 迭代 、 逐 渐 扩 充 和 完善 的 进化 过 程 。 二 是 与 
数据 库 技术 相 结 合 ,实现 领域 知识 库 的 建立 , 异 构 数据 
库 知 识 的 共享 .重用 等 。 三 是 应 用 机 器 学 习 技 术 从 海 
量 职 官 信息 中 智能 抽取 挖掘 ,形成 知识 单元 语义 链 , 节 
约 手工 整理 和 人 工 筛选 时 间 ,实现 大 规模 语 料 的 内 容 
识别 .甄别 与 鉴别 。 四 是 构建 职 官 知识 图 谱 , 构 筑 知 识 
集群 网 。 应 用 知识 计量 、 图 形 学 ,数据库 、 数 据 挖掘 等 
技术 构建 职 官 领域 知识 图 谱 , 通 过 关键 词 搜索 ,地 图 式 
景 再 现 揭示 职 官 群体 发 展 脉络 ,发 现 可 能 存在 的 新 
兴 事 物 或 新 型 知识 关系 ,同时 , 引 介 GIS 技术 呈现 职 官 
任职 迁移 路 径 ,构建 职 官 群体 变迁 空间 网 络 结构 。 
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Knowledge Organization and Relation Analysis of Officials in Qing Dynasty 


一 一 Taking Changchun County Annals . Changchun Official Examination and Interpretation Form 


as An Example 


Deng Jun Zhong Chuyi Wang Ruan Song Xueyan Liu Qinchun 


School of Management, Jilin University, Changchun 130022 


Abstiract: | Purpose/significance | With the help of the concept and method of digital humanities the in-depth 


development of relevant resources in the field of professional officers in China from the perspective of knowledge will 


help scholars in the field to carry out in-depth humanities research and enrich the study of officials in the field of dig- 


ital humanities. | Method/process | Based on sorting out the knowledge system structure of Qing Dynasty officials 


and collecting related digital resources, this paper built the ontology model of Qing Dynasty officials” domains, and 


took Changchun County Annals 。 


Changchun Official Examination and Interpretation Form as an example to add and 


visualize. | Result/conclusion | This paper has achieved fine-grained description and organization on the semantic 


level of official knowledge units, and has revealed multi-level, multi-dimensional, multi-class, and complex inter- 


laced dynamic relationships among knowledge units. 
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